机译:在不确定的马尔可夫决策过程(MDP)中将后悔最小化的基于采样的方法
机译:基于对不确定的马尔可夫决策过程中遗憾的基于方法(MDPS)
机译:水资源管理中多目标马尔可夫决策过程的基于树的拟合Q迭代
机译:基于后悔的不确定马尔可夫决策过程的鲁棒解决方案
机译:用于集中式和分散式部分可观察的马尔可夫决策过程的算法中的可伸缩性不断增强:在不确定的环境中进行有效的决策和协调。
机译:不确定性下的决策:基于部分可观察的马尔可夫决策过程的神经模型
机译:不确定背景下基于大型马尔可夫决策过程的内河航道管理策略